Objets Sonores: Une Représentation Bio-Inspirée Hiérarchique Parcimonieuse À Très Grandes Dimensions Utilisable En Reconnaissance; Auditory Objects: Bio-Inspired Hierarchical Sparse High Dimensional Representation for Recognition

نویسندگان

  • Simon Brodeur
  • Jean Rouat
چکیده

The emphasis is put on the hierarchical structure, independence and sparseness aspects of auditory signal representations in high-dimensional spaces, so as to define the components of auditory objects. The concept of an auditory object and its neural representation is introduced. An illustrative application then follows, consisting in the analysis of various auditory signals : speech, music and natural outdoor environments. A new automatic speech recognition (ASR) system is then proposed and compared to a conventional statistical system. The proposed system clearly shows that an object-based analysis introduces a great flexibility and robustness for the task of speech recognition. The integration of knowledge from neuroscience and acoustic signal processing brings new ways of thinking to the field of classification of acoustic signals.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Traitement continu des requêtes dépendantes de la localisation dans les environnements intérieurs

This paper develops a data and knowledge representation of an indoor environment that takes into account user-centred contextual dimensions and mobile data management issues. We introduce a hierarchical, context-dependent, and feature-based indoor spatial data model in which location information is represented at different levels of abstraction. A query language supporting continuous location-d...

متن کامل

Plongement incrémental dans un contexte de dissimilarité

RÉSUMÉ. Le domaine de la reconnaissance statistique de formes est basé sur la représentation numérique des objets et peut donc être facilement combiné avec des méthodes d’apprentissage automatique. D’autre part, la reconnaissance structurelle de formes utilise un ensemble limité de méthodes d’apprentissage automatique mais encode une riche description des objets via les chaînes de caractères ou...

متن کامل

On Segments and Syllables in the Sound Structure of Language: Curve-based Approaches to Phonology and the Auditory Representation of Speech.1

RÉSUMÉ — SUR LES NOTIONS DE SEGMENT ET DE SYLLABE DANS LA FORME SONORE DU LANGAGE : LES COURBES EN PHONOLOGIE ET LA REPRÉSENTATION AUDITIVE DE LA PAROLE. Les approches récentes de la syllabe réintroduisent une description continue et descriptible mathématiquement des objets sonores : les « courbes ». Les recherches psycholinguistiques sur la perception du langage parlé ont plutôt recours à des ...

متن کامل

Eigenvoices: A compact representation of speakers in model space

Titre francais: Voix propres: Vers une représentation compacte des locuteurs dans l'espace des modèles Traduction du titre des figures: Figure 1: Schéma bloc d'un système de reconnaissance de la parole Figure 2: Schéma général du système de voix propres 1 Summary: In this article, we present a new approach to modeling speaker-dependent systems. The approach was inspired by the eigenfaces techni...

متن کامل

Local Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study

Recently, methods based on local image features have shown promise for texture and object recognition tasks. This paper presents a large-scale evaluation of an approach that represents images as distributions (signatures or histograms) of features extracted from a sparse set of keypoint locations and learns a Support Vector Machine classifier with kernels based on two effective measures for com...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • CoRR

دوره abs/1311.5924  شماره 

صفحات  -

تاریخ انتشار 2013